메뉴

#인공지능 연구

HN
Hacker News 4일 전
IMP 8

언어 모델도 수면이 필요하다

최근 트랜스포머 기반 대형 언어 모델(LLM)은 문맥 길이가 길어질수록 어텐션 메커니즘의 연산 효율이 급격히 떨어지는 한계를 보입니다. 이를 해결하기 위해 본 논문은 인간의 '수면'과 유사한 통합 메커니즘을 제안하여, 모델이 최근 문맥을 영구적인 빠른 가중치(fast weights)로 변환하고 기존의 키-값 캐시를 초기화하는 방식을 도입했습니다. 기존 모델들이 실패한 복잡한 수학적 추론 작업에서도 이 방법론이 뛰어난 성능 향상을 보여주며, 깊은 추론이 필요한 문제일수록 효과가 극대화된다는 점이 핵심적인 성과입니다.

대형 언어 모델 트랜스포머 컨텍스트 윈도우
TC
TechCrunch AI 10일 전
IMP 8

오픈AI, 80년된 수학 난제 최초로 해결

오픈AI가 수학계의 거장 폴 에르되시가 1946년에 제기한 지오메트리 미해결 추측을 기각하는 완전히 새로운 증명을 AI 모델이 자율적으로 생성했다고 발표했습니다. 과거 기존 문헌의 해답을 '새로운 풀이'로 오해했던 전철을 밟지 않기 위해, 이번에는 에르되시 문제 웹사이트 관리자인 토마스 블룸 등 저명한 수학자들의 검증과 지지 성명을 동반했습니다. 이번 증명은 수학 전용 시스템이 아닌 범용 추론(reasoning) 모델에서 도출된 점이 핵심이며, 장기적이고 복잡한 논리적 사고가 가능해진 AI의 발전이 향후 물리학, 공학, 의학 등 타 분야에도 지대한 영향을 미칠 것임을 시사합니다.

OpenAI 수학 증명 추론 모델
SG
r/singularity 10일 전
IMP 9

OpenAI 범용 모델, 80년 된 수학 난제 자율 해결

OpenAI의 범용 추론 모델이 1946년 폴 에르되시(Paul Erdős)가 제기한 '평면 단위 거리 문제(Planar Unit Distance Problem)'의 기존 통념을 반증하는 새로운 구조를 자율적으로 발견했습니다. 수학 분야의 핵심적인 미해결 난제를 AI가 단독으로 해결한 최초의 사례로, 수학계와 AI 산업 양쪽에 중요한 마일스톤이 됩니다. 전문적인 수학 문제 해결에 특화되지 않은 일반 목적의 모델이 길고 복잡한 추론 과정을 거쳐 성과를 냈다는 점에서 AI의 추론 능력 한계 돌파를 시사합니다.

인공지능 연구 수학 난제 해결 범용 추론 모델
WR
Wired AI 36일 전
IMP 8

소니 AI 탁구 로봇 '에이스(Ace)', 프로 선수도 상대하는 압도적 실력

소니 AI 연구진이 개발한 탁구 로봇 '에이스(Ace)'가 공식 규칙 하에 인간 고급 아마추어 및 프로 선수들과 경기를 치르며 승리를 거두는 기술적 이정표를 세웠습니다. 고속 센서, 실시간 의사결정 AI, 8관절 고속 로봇 팔을 결합하여 복잡하고 빠르게 변하는 실제 물리 환경에서 인간과 대등한 반응 속도와 제어력을 입증했습니다. 이 성과는 탁구를 넘어 예측 불가능한 실세계 환경에서 정확하고 빠르게 작동해야 하는 산업 전반의 실용적인 로봇 응용 분야를 여는 핵심 전기로 평가받습니다.

로봇 공학 소니 AI 인공지능 연구
ML
r/MachineLearning 41일 전
IMP 7

매일 쏟아지는 AI 논문: arXiv ML 분야 일일 100~200편 게재

프론티어 AI 모델 경쟁이 치열해지며 머신러닝 및 AI 관련 연구 논문이 매일 폭발적으로 증가하고 있습니다. 최근 5일(4월 14일~20일) 동안 arXiv의 머신러닝 카테고리에만 총 896편의 새로운 논문이 올라왔으며, 하루 평균 약 180편에 달하는 수치입니다. 이는 LLM(대형 언어 모델) 미세조정, 보상 해킹 방지, 신약 개발 등 다양한 산업계 실무 응용 연구가 전 세계적으로 매우 빠르게 진행되고 있음을 시사합니다.

머신러닝 논문 동향 arXiv